太神奇了,NCBI序列批量下载小技巧
我们在做系统发育或生信分析的时候,经常会使用数据库的序列作为参考。
下载单条序列简单不过,无非就是打开NCBI主页,选择数据库后输入AC号或GI号后直接下载。
但是如何大批量下载呢?实现这一目的通常办法是借助一些生物软件的检索功能,诸如:Bioedit、Geneious、MacVector等,但是这些软件的下载和学习有时也会花费很多时间。其实,NCBI自带的一些小工具即可轻松完成这一任务。
NCBI中序列批量下载方法1
该方法适用于已知序列号且最好是序列号连续的大量FASTA格式序列下载,具体步骤如下:
1.登陆NCBI主页,下拉菜单中选择"Nucleotide";
2.如若想获得序列号为“FJ552695到FJ552699”的所有序列,那么只需要在检索框中输入“FJ552695:FJ552699 [ACCN]”
后搜索;就会得到这两个序列之间的所有序列,如下图:
3.后点击右上角“Send to:”旁边的下拉菜单,选择“File”,然后Format选择选择"FASTA", Sort by选择"Accession"后点击“Creat File”选择保存路径即可。
NCBI中序列批量下载方法2
根据http://www.plob.org/2014/06/06/8251.html博客:
【絮语】
下载序列简单不过,无非就是联网NCBI主页,选择数据库后输入AC号或GI号后直接下载。但是如何大批量下载,而且下载的序列是指定的AC或GI的呢?实现这一目的通常办法是借助一些生物软件的检索功能,诸如:Bioedit、Geneious、MacVector等。其实,NCBI自带的Batch Entrez 只需简单三步即可轻松完成这一任务。
【准备工作】
创建一个需要下载序列AC号的列表文件,每行一个独立的AC号,保存为文本文件:
【简要流程】
1. 打开网页,粘贴这个网址:http://www.ncbi.nlm.nih.gov/sites/batchentrez?
2. 点击“浏览”按钮,选择事先准备带AC号的文本文件后,点击“Retrieve”开始检索,数秒后即可返回检索的序列记录;
3. 点击检索到的序列记录“Retrieve recordsfor 48 UID(s)”即可,后面就是“Send to” 保存要下载的序列,后面的操作就不在赘述,详见前面一些相关教程。
4. Good luck!